DeepSeek 'tốn hơn tỷ USD thay vì 5,6 triệu USD cho AI'
DeepSeek ước tính đã tiêu tốn khoảng 1,6 tỷ USD để phát triển các mô hình AI, thay vì chỉ 5,6 triệu USD như công ty đã tuyên bố. Theo phân tích của SemiAnalysis, chi phí riêng cho phần cứng của DeepSeek lên tới hơn 500 triệu USD.
Ngoài ra, việc tạo dữ liệu tổng hợp cho mô hình đào tạo cần nhiều tài nguyên tính toán. Số tiền 5,6 triệu USD chỉ tính chi phí đào tạo, chưa bao gồm chi phí nghiên cứu, phát triển, chuẩn bị dữ liệu, bảo trì phần cứng và các vấn đề liên quan khác. Phân tích cho thấy tổng chi phí vốn máy chủ có thể lên tới 1,6 tỷ USD, trong đó 944 triệu USD dành cho việc vận hành các cụm máy.
Họ cần thử nghiệm, phát triển kiến trúc mới, thu thập và làm sạch dữ liệu, trả lương cho nhân viên và nhiều việc khác. Giao diện phần mềm DeepSeek và logo công ty. Ảnh Tuấn Hưng. Theo SemiAnalysis, DeepSeek có thể đã tiếp cận khoảng 10.000 mẫu GPU Nvidia H800 giảm hiệu năng để tuân thủ lệnh cấm chip AI của Mỹ đối với Trung Quốc, cùng với khoảng 10.000 GPU H100. Công ty cũng có thể sử dụng phiên bản H20 để đào tạo các mô hình.
Các GPU này được chia sẻ giữa quỹ đầu tư High-Flyer và DeepSeek, với phân phối theo địa lý. Chúng được sử dụng cho giao dịch, suy luận, đào tạo và nghiên cứu. DeepSeek đã đăng nhiều thông tin tuyển dụng nhân tài AI và tổ chức sự kiện tại các trường đại học hàng đầu Trung Quốc, với cơ hội tiếp cận 10.000 GPU không giới hạn. Công ty hứa hẹn mức lương trên 1,3 triệu USD mỗi năm cho một số ứng viên triển vọng, cao hơn nhiều so với các công ty công nghệ lớn và các phòng thí nghiệm AI khác.
DeepSeek vẫn duy nhất và tiên phong trong việc tối ưu chi phí cho các mô hình AI mạnh mẽ. SemiAnalysts nhấn mạnh rằng DeepSeek R1 là mô hình xuất sắc và việc nhanh chóng bắt kịp ranh giới lý luận AI toàn cầu là rất ấn tượng. DeepSeek chưa có bình luận nào và trong các công bố trước, họ cũng không công bố con số tổng thể, chỉ nêu mức 5,576 triệu USD chủ yếu dành cho thuê máy chủ AI và đào tạo các mô hình.
Con số này chưa bao gồm các nghiên cứu và thí nghiệm về kiến trúc, thuật toán hay dữ liệu. Một số chuyên gia cho rằng DeepSeek đã tối ưu hóa việc huấn luyện mô hình AI với chi phí thấp, nhưng 6 triệu USD chưa phải là con số cuối cùng. Yann LeCun, Giám đốc AI của Meta, lưu ý rằng có sự hiểu lầm lớn khi so sánh chi tiêu của các công ty Mỹ vào AI với DeepSeek.
Có sự hiểu lầm về đầu tư vào cơ sở hạ tầng AI. Hầu hết số tiền hàng tỷ USD được chi cho hạ tầng suy luận, không phải đào tạo, như LeCun đã chia sẻ trên mạng xã hội. Việc vận hành dịch vụ trợ lý AI cho hàng tỷ người cần nhiều tính toán. Khi tích hợp khả năng hiểu video, lý luận và bộ nhớ lớn vào AI, chi phí suy luận tăng lên. Do đó, phản ứng của thị trường đối với DeepSeek là thiếu căn cứ.
Thomas Sohmers, nhà sáng lập Positron, đồng ý với LeCun rằng suy luận sẽ chiếm tỷ trọng lớn hơn trong chi phí hạ tầng AI. Ông cho biết nhu cầu và chi tiêu cho hạ tầng sẽ tăng nhanh chóng. Trong tương lai, khi DeepSeek trở nên phổ biến, công ty sẽ phải xử lý nhiều yêu cầu hơn và do đó phải chi nhiều tiền hơn cho suy luận. Alexandr Wang, CEO của Scale AI, cũng tiết lộ rằng DeepSeek đang sở hữu 50.
DeepSeek đã mua 000 chip Nvidia H100, nhưng không thể công khai thông tin này do các biện pháp kiểm soát xuất khẩu của Mỹ, theo lời Wang. Elon Musk, người sáng lập xAI và có mối quan hệ thân thiết với cựu Tổng thống Donald Trump, đồng tình với điều này. Công ty cũng được cho là đã sử dụng kỹ thuật chưng cất để tiết kiệm chi phí. Vào ngày 291, OpenAI thông báo với FT rằng họ nghi ngờ DeepSeek đã áp dụng kỹ thuật này, giúp các nhà phát triển đạt hiệu suất tốt hơn trên các mô hình nhỏ bằng cách tận dụng đầu ra từ các mô hình lớn với chi phí thấp hơn.
DeepSeek được Liang Wenfeng thành lập vào tháng 5 năm 2023, có trụ sở tại Hàng Châu, Chiết Giang, và thuộc sở hữu của quỹ đầu tư High-Flyer. Công ty được High-Flyer tài trợ và không có kế hoạch huy động vốn, tập trung vào phát triển công nghệ nền tảng. Tuy nhiên, nhiều người hoài nghi về chi phí thấp của AI Trung Quốc, và phản ứng của thị trường đối với DeepSeek cho thấy sự thiếu cơ sở. Chủ tịch ChatGPT đã thừa nhận rằng họ đã sai lầm trong cơn sốt DeepSeek.
Nguồn:vnexpress.net/deepseek-ton-hon-ty-usd-thay-vi-5-6-trieu-usd-cho-ai-4845092.html